Algorithme automatique non supervisé pour le Deft 2012 (Automatic unsupervised algorithm for Deft 2012) [in French]
نویسندگان
چکیده
Murat Ahat 1 Coralie Petermann 1, 2 Yann Vigile Hoareau 3 Soufian Ben Amor 1 Marc Bui 2 (1) Prism, Université de Versailles Saint-Quentin-en-Yvelines, 35 avenue des Etats-Unis, F-78035 Versailles. (2) LaISC, Ecole Pratique des Hautes Etudes, 41 rue Gay-Lussac, F-75005 Paris. (3) CHArt, 41 rue Gay-Lussac, F-75005 Paris. [email protected], [email protected], [email protected], [email protected], [email protected]
منابع مشابه
Key-concept extraction from French articles with KX
We present an adaptation for the French text mining challenge (DEFT 2012) of the KX system for multilingual unsupervised key-concept extraction. KX carries out the selection of a list of weighted keywords from a document by combining basic linguistic annotations with simple statistical measures. In order to adapt it to the French language, a French morphological analyzer (PoS-Tagger) has been a...
متن کاملMusic period detection of music collections using learning techniques (Détection de périodes musicales d'une collection de musique par apprentissage) [in French]
Résumé. Dans ces travaux, nous présentons une approche afin d’étiqueter une large collection de chansons francophones. Nous avons développé une interface utilisant les paroles comme point d’entrée afin d’explorer cette collection de musique avec des filtres en fonction de chaque période musicale. Dans un premier temps, nous avons collecté paroles et métadonnées de différentes sources sur le Web...
متن کاملParticipation de l'IRISA à DeFT2012 : recherche d'information et apprentissage pour la génération de mots-clés (IRISA participation to DeFT2012: information retrieval and machine-learning for keyword generation) [in French]
IRISA participation to DeFT 2012 : information retrieval and machine learning for keyword generation This paper describes the IRISA participation to the DeFT 2012 text-mining challenge. It consisted in the automatic attribution or generation of keywords to scientific journal articles. Two tasks were proposed which led us to test two different strategies. For the first task, a list of keywords w...
متن کاملDétection de mots-clés par approches au grain caractère et au grain mot (Keywords extraction by repeated string analysis) [in French]
RÉSUMÉ Nous présentons dans cet article les méthodes utilisées par l’équipe HULTECH pour sa participation au Défi Fouille de Textes 2012 (Deft 2012). La tâche de cette édition du défi consiste à retrouver dans des articles scientifiques, les mots-clés choisis par les auteurs. Nous nous appuyons sur la détection de chaînes répétées maximales (rst rmax), au grain caractère et au grain mot. La mét...
متن کاملIndexation à base des syntagmes nominaux (Nominal-chunk based indexing) [in French]
This paper presents the URPAH team’s participation in DEFT 2012.Our approach uses noun phrases in the automatic identification of keywords indexing the content of scientific papers published in a review of Human and Social Sciences, with assistance from the terminology of keywords (piste1) and without terminology (piste2 ) MOTS-CLÉS : syntagmes nominaux, patrons syntaxiques, recherche d’informa...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2012